IT之家
04-26 07:05
英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user
📌 一句话:英伟达服务器已原生支持国产DeepSeek-V4,单用户每秒生成超150词元,AI推理进入"即时响应"时代。
💡 3个要点
英伟达GB200 NVL72服务器已原生适配DeepSeek-V4模型,开箱即用无需额外优化
实测性能超过150 tokens/sec/user,响应速度达到毫秒级交互体验
体现AI基础设施与模型深度协同优化的行业趋势,软硬件整合成核心竞争力
📖 背景
DeepSeek-V4是国产开源大模型,性能对标GPT-4等国际顶级模型,此次获英伟达官方适配意义重大。
💭 点评
性能突破150 tokens/sec意味着AI交互从"等待"变成"对话",这不是简单的数字提升,而是应用场景的彻底打开——实时翻译、即时问答、现场辅助决策都将变为可能。英伟达主动适配国产模型,既是技术认可,也预示着AI竞争进入"落地为王"阶段。
📖 原文链接
点击阅读原文 →